Die Gratwanderung zwischen qualitativ hochwertigen und einfach zu erstellenden domänenspezifischen Textanalysen

نویسنده

  • Cornelia Kiefer
چکیده

Die Textanalyse ist zu einem entscheidenden Werkzeug in verschiedenen Domänen wie den Geisteswissenschaften, Naturwissenschaften sowie auch in der Industrie geworden. Eine der größten Herausforderungen bei domänenspezifischen Textanalyseprojekten besteht darin, das Wissen aus den Bereichen IT und Text Mining mit dem Wissen aus der Domäne zusammenzubringen. Viele Textanalysetoolkits werden deshalb speziell für den Gebrauch durch Domänenexperten ohne oder mit wenig IT und Textanalysewissen vereinfacht. In diesem Beitrag diskutieren wir, inwiefern diese Vereinfachungen zu Qualitätsproblemen bei der Analyse von unsauberen Daten führen können.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Teleteaching an der Universität Göttingen: Systemarchitektur und Problematiken

Im Rahmen des ELAN Projekts des Landes Niedersachsen wird der Aufbau eines Lehrverbundes Informatik zwischen der Universität Göttingen und der Technischen Universität Clausthal durchgeführt. Im Bereich der Informatik sollen Kapazitäten und Ressourcen zusammengeführt werden, um standortübergreifend für beide Hochschulen eine umfangreiche und hochwertige Informatikausbildung zu gewährleisten. In ...

متن کامل

PLuTO - Portable Lern- und Wissensplattform zum Transfer episodischen Wissens in Organisationen

Das Projekt PLuTO unterstützt mittels multimedialer Wissensaufnahme und multimodalem Zugriff den Austausch von episodischem Wissen zwischen älteren und jüngeren Mitarbeitern. Dabei wird das Wissen direkt in den Werkhallen der Unternehmen aufgenommen. Der Wissensabruf erfolgt über Tablets direkt in der Werkstatt. Neben Sensordaten werden auch Multimediadaten, wie Fotos oder Videos, direkt im Arb...

متن کامل

Automatische Aufgabenkorrektur mit VIPLab

Das Ziel des ViPLab-Projektes der Universität Stuttgart [2] ist die Durchführung von Programmierübungen und elektronischer Prüfungen im ILIAS Lernmanagement-System der Universität Stuttgart. Historisch entstand das Projekt aus der Notwendigkeit heraus, Studierende in den Bachelor-Studiengängen so rasch wie möglich an Programmiersprachen und numerische Software wie Matlab heran zu führen, wofür ...

متن کامل

Ein lernendes System zur Verbesserung der Datenqualität und Datenqualitätsmessung

Insbesondere in der Finanzdienstleistungsbranche kommt einer guten Qualität der Datenhaushalte bereits heute eine herausragende Bedeutung zu. Die Relevanz von qualitativ hochwertigen Daten wird durch neue gesetzliche Rahmenrichtlinien, wie z. B. Basel II, und durch Umbrüche in der Bankenund Versicherungslandschaft verstärkt. In dem folgenden Artikel wird ein System vorgestellt, das Datenqualitä...

متن کامل

Modellbasierte Oberflächen für Abnahmetests

Die Durchführung von Tests ist eine Voraussetzung zur Erstellung qualitativ hochwertiger, nicht trivialer Softwaresysteme. Das modellgetriebene Testen ermöglicht eine hohe Testabdeckung bei gleichzeitiger Abstraktion von der zu testenden Implementierung, was insbesondere beim Testen innerhalb von Produktfamilien von Vorteil ist. Als Alternative zur vollständigen Generierung von Testmodellen ste...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2017